導(dǎo)讀:最近,搜索引擎戰(zhàn)略會議在寒冷的芝加哥舉行。許多谷歌參加者總是被問及關(guān)于重復(fù)內(nèi)容的問題。對于這個話題,我們發(fā)現(xiàn)有許多破碎的并且有些混亂的理解。我們想在此予以澄清。最近
發(fā)表日期:2020-07-01
文章編輯:興田科技
瀏覽次數(shù):9213
標簽:
最近,搜索引擎戰(zhàn)略會議在寒冷的芝加哥舉行。許多谷歌參加者總是被問及關(guān)于重復(fù)內(nèi)容的問題。對于這個話題,我們發(fā)現(xiàn)有許多破碎的并且有些混亂的理解。我們想在此予以澄清。
最近,搜索引擎戰(zhàn)略會議在寒冷的芝加哥舉行。許多谷歌參加者總是被問及關(guān)于重復(fù)內(nèi)容的問題。對于這個話題,我們發(fā)現(xiàn)有許多破碎的并且有些混亂的理解。我們想在此予以澄清。
什么是內(nèi)容重復(fù)?
重復(fù)的內(nèi)容一般是指在不同域名間存在大量的相同或相似的內(nèi)容。很多時候,它并非故意或至少本無惡意。譬如說,有些論壇會生成一些專為手機屏幕的頁面;商店物品被顯示在(有時甚至是鏈接到)多種不同的URL上,等等。但有些時候,一些網(wǎng)站為了操縱搜索引擎排名,獲得更多流行或長尾查詢的訪問量,大量地從其他網(wǎng)站復(fù)制內(nèi)容。
什么不是重復(fù)內(nèi)容?
雖然谷歌網(wǎng)站有方便易用的翻譯功能,我們的算法不會把有著相同內(nèi)容的英文版和西班牙文版看作內(nèi)容復(fù)制。同樣,你不用擔心我們把你文章中對其他文章小片段的引用認定為重復(fù)內(nèi)容。
什么谷歌關(guān)心重復(fù)內(nèi)容?
谷歌用戶使用Google時通常希望看到多樣化的原創(chuàng)內(nèi)容。如果他們找到的都是內(nèi)容相同的一堆搜索結(jié)果,可以想見那是多么煩人。另外,網(wǎng)站管理員不愿意看到Google給出象example.com/contentredir?value=shorty-george〈=en一樣復(fù)雜的URL。他們往往更喜歡類似example.com/en/shorty-george.htm的URL。
谷歌做了些什么?
Google在抓取網(wǎng)頁和獲得搜索結(jié)果時,總是力圖索引并顯示內(nèi)容不同的頁面。這種過濾意味著,譬如說,如果你的網(wǎng)站有文章的正常版和打印版,并且你沒有在robots.txt里設(shè)定noindex標記,谷歌就只會選擇一個版本顯示給谷歌用戶。對于企圖利用復(fù)制內(nèi)容來操控排名,欺騙谷歌用戶的少數(shù)情況,我們會在對相關(guān)頁面的索引和排名作出適當調(diào)整。當然,我們更愿意把重點放在過濾而不是排名調(diào)整上… 因此,在絕大多數(shù)情況下,最壞的結(jié)果就是原創(chuàng)者看到了不愿看到的版本出現(xiàn)在我們的索引里。
網(wǎng)站管理員如何主動處理內(nèi)容復(fù)制問題?
適當阻止搜索引擎訪問:與其讓我們的算法來確定一個文件的"最佳"版本,你也許希望指引谷歌選取你的首選版本。譬如說,如果你不想我們索引你網(wǎng)站文章的打印版,你可以在你的robots.txt文件中寫上目錄名或正則表達式來禁止谷歌對那些打印版的抓取。
使用301重定向:如果你已經(jīng)重構(gòu)你的網(wǎng)站,請在你的原網(wǎng)站的.htaccess中使用301重定向(永久性重定向)來重定向你的用戶、Google爬蟲、以及其他搜索引擎蜘蛛等。
鏈接要一致:努力使你的內(nèi)部鏈接保持一致; 不要既有/page/,又有/page和/page/index.htm 的內(nèi)部鏈接
使用頂級域名:為了讓我們總是使用最合適的文件版本, 請盡可能使用國家特定的頂級域名。與諸如example.com/de或de.example.com的URL相比,谷歌肯定更清楚地知道example.de是以德文為核心的內(nèi)容。
小心辛迪加式的聯(lián)合供文:如果你為其他網(wǎng)站上也提供你的內(nèi)容,請在每一個其他網(wǎng)站的文章中包括連回原文章的鏈接。注意:即使是這樣,對一個查詢,谷歌總是顯示我們認為是最適合的(沒被網(wǎng)站禁止的)版本, 它可能是,也有可能不是你所想要的版本。
使用谷歌網(wǎng)站管理員工具的首選域功能: 如果其他網(wǎng)站鏈接你的URL時既使用www版本又使用無www的版本,你可以用谷歌網(wǎng)站管理員工具讓我們知道你想要哪種索引方式。
減少模板網(wǎng)頁上的重復(fù)內(nèi)容:拿版權(quán)聲明來說,你有兩種選擇,一種是在你的每一個頁面底部都有一個冗長的版權(quán)聲明。另一種是設(shè)立一個專門的版權(quán)詳細聲明頁,然后在每頁底部寫一個非常簡短的總結(jié),并鏈接到版權(quán)聲明頁。
避免發(fā)布無內(nèi)容頁:用戶不喜歡看到無實際內(nèi)容的頁面。要盡量避免空架頁。以房地產(chǎn)網(wǎng)頁為例,不要發(fā)布(或至少要阻止)沒有點評的點評網(wǎng)頁,或者沒有房地產(chǎn)列表的房地產(chǎn)羅列網(wǎng)站等。只有這樣,網(wǎng)站用戶(以及Google爬蟲)才不會看到無窮多的寫著"以下是在【某城市名】中不可錯失的待租房列表…"但其實根本沒有什么列表的網(wǎng)頁。
了解你的內(nèi)容管理系統(tǒng):確保你熟悉你的網(wǎng)站是怎樣顯示內(nèi)容的,尤其是當它包括了博客,論壇,或相關(guān)的系統(tǒng)。往往在這些系統(tǒng)中同一內(nèi)容會以多種形式出現(xiàn)。
不要擔心,保持快樂:不要過分受搜刮(挪用和轉(zhuǎn)載)你內(nèi)容站點的干擾。雖然很惱人, 它們幾乎不可能對你在谷歌中的存在產(chǎn)生負面影響。如果你實在忍無可忍, 歡迎你提出千禧年著作權(quán)法案申請 來聲明對你的內(nèi)容的所有權(quán)。我們會處理那些無賴網(wǎng)站。
總之, 如果你對內(nèi)容復(fù)制問題有一個大體的認識,又能花上幾分鐘有見地地預(yù)防性維護一下你的網(wǎng)站,這將既幫助你們,也幫助我們?yōu)橛脩籼峁┆毺囟嚓P(guān)的內(nèi)容。
更多新聞
2020
最近很多新站為了提高網(wǎng)站的收錄和人氣,想盡各種方法推廣。而其中的必殺計之一就是軟文營銷了。網(wǎng)絡(luò)新聞、軟文營銷的優(yōu)勢:1、 費用低。顛覆傳統(tǒng)高成本及平面及電視廣告營銷傳
View details
2020
關(guān)于網(wǎng)站優(yōu)化,大家可能都了解,創(chuàng)業(yè)的第一步就是找到客戶,那在以前創(chuàng)業(yè)的時候要想找到自己公司的目標客戶都是使用傳統(tǒng)的銷售模式,要不就是朋友介紹這樣的
View details
2020
關(guān)于官網(wǎng)優(yōu)化,其實吧想要做好網(wǎng)站外部鏈接。然而SEO說簡單也簡單,說復(fù)雜也復(fù)雜。團隊運用的是否為正規(guī)的技術(shù)? 我個人曾經(jīng)用過一些非正規(guī)技術(shù),但是經(jīng)過一
View details
2020
關(guān)于搜索引擎優(yōu)化,對于網(wǎng)站建設(shè)的首頁可以說它就相當于人的臉面,因為我們看一個人的時候,首先看到的是對方的臉,相對的搜索引擎優(yōu)先的參考對象就是標題了
View details